CUDA_VISIBLE_DEVICES=2,3  deepspeed pretrain_model.py